1. Descubriendo el microorganismo de la secuencia.
.Situación taxonómica
Como se puede observar en este arbol filogenetico anuestra enigmática especie que aparece como Query es de la especie Rhodococcus con un 81% de posibilidades de ser Rhodococcus opacus
2. Análisis informático de la secuencia mediante el programa ARTEMIS
Con la secuencia de 17000 bases que se nos ha dado estudiamos todos los ORFs a través de la aplicación blast del NCBI.
El fragmento contiene 86 ORFs (CDS). Se indican a continuación los que codifican para proteínas y el lugar que ocupan en mi segmento de DNA:
Falta el esquema de Artemis
552:2330 reverse
815 bp at 5' side: MarR-family protein transcriptional regulator
290 bp at 3' side: elongation factor Ts
1984:2790 forward transcriptional regulator, TetR family protein
7562:9013 forward hypothetical membrane protein
8186:9163 reverse hypothetical membrane protein
10623:12377 forward hypothetical protein hypothetical membrane protein
10900:11721 reverse hypothetical protein
11399:11980 forward hypothetical protein
12352:13320 forward hypothetical protein
13148:14917 reverse superoxide dismutase
14792:15172 forward 88 bp at 5' side: superoxide dismutase
123 bp at 3' side: putative acyltransferase
Estos dos primers izquierdo y derecho creados manualmente poco viables ya que al probarlos con el Primer3 nos dice que tienen diferentes tm y alta complementariedad 3´ en el primer izquierdo.
OLIGO start len tm gc% any 3' seq
LEFT PRIMER 1 19 61.18 57.89 6.00 6.00 AGGCCGACTACATCGATCG
RIGHT PRIMER 1080 18 51.30 50.00 5.00 2.00 TCAGAAGTTCCAGTCCAC
Tamaño de la secuencia: 1080 pb
Tamaño incluído entre los primers: 1080pb
Complementariedad entre primers: 6.00
Complementariedad del extremo 3': 0.00
¿Tm de los primers? ¿A qué temperatura realizaría la amplificación? ¿Sitios de corte de losprimers?
Diseño de primers para amplificar fragmentos internos del gen/es y comprobar si dicho gen/es son esenciales o no para el microorganismo.
Ahora con el Primer3 buscamos los primers más óptimos dentro de la secuencia:
OLIGO start len tm gc% any 3' seq
LEFT PRIMER 220 20 60.34 50.00 4.00 0.00 GAGAAGATTCCGCTGTCCAA
RIGHT PRIMER 617 20 60.02 50.00 5.00 0.00 AAGCCGCTGTAGAACAGGAA
SEQUENCE SIZE: 1080
INCLUDED REGION SIZE: 1080
Este es el más óptimo pero el programa te calcula otros adicionales:
ADDITIONAL OLIGOS
start len tm gc% any 3' seq
1 LEFT PRIMER 220 20 60.34 50.00 4.00 0.00 GAGAAGATTCCGCTGTCCAA
RIGHT PRIMER 602 20 60.23 50.00 5.00 0.00 AGGAACGATTCGAGCATCAC
PRODUCT SIZE: 383, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 1.00
2 LEFT PRIMER 220 20 60.34 50.00 4.00 0.00 GAGAAGATTCCGCTGTCCAA
RIGHT PRIMER 605 20 59.70 45.00 5.00 3.00 AACAGGAACGATTCGAGCAT
PRODUCT SIZE: 386, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 2.00
3 LEFT PRIMER 585 20 60.23 50.00 5.00 0.00 GATGCTCGAATCGTTCCTGT
RIGHT PRIMER 890 20 59.57 50.00 4.00 1.00 TTGAACCGCATGTAGGACAC
PRODUCT SIZE: 306, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 2.00
4 LEFT PRIMER 585 20 60.23 50.00 5.00 0.00 GATGCTCGAATCGTTCCTGT
RIGHT PRIMER 891 20 59.57 50.00 5.00 3.00 GTTGAACCGCATGTAGGACA
PRODUCT SIZE: 307, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 3.0
Para comprobar si el gen es esencial para el microorganismo la manera más sencilla y práctica es producir una delección en el gen mediante Pcr de forma que quede no funcional. Si en el posterior cultivo del microorganismo no muestra ninguna diferencia es que este gen no es esencial para su funcionamiento.
Cojo los primers generados por Primer3 que sean mas eficaces y dentro los cojo a mano los complementarios:
Diseño de primers para amplificar los genes que codifican para la/s proteína/s de interés con colas de histidina para su rápida purificación.
Primer izquierdo: CCCGAATTCGGGGAGAAGATTCCGCTGTCCAA
Primer derecho: CCCGAATTCGGGAGGCGCCGCCGCCGCCGCCGCAACGATTCGAGCAT
Hemos añadido un residuo de 6 histidinas (TAG) en extremo 3´ del primer derecho y hemos utilizado la secuencia de nucleotidos reconocida por EcoRI para la restricción.
Estudio de la/s proteína/s por bioinformática (dominios conservados, hidrofobicidad, estructura, características bioquímicas…..)
Los ribonucleótidos reductasa (RNR) catalizan la sintesis reductiva de desoxirribonucleotidos de sus correspondientes ribonucleotidos. Su unción es aportar los precursores para la sintesis de adn (ADN) . Los RNR se dividen segun el cofactor metálico usado. En este caso es de tipo 2 y usan coenzima B12 (adenosilcobalamina, AdoCbl). Faltan referencias.
RNR es una enzima oligomerica compuesta por una larga ( Large en ingles se es grande en castellano) subunidad (700 a 1000 residuos) y una subunidad pequeña (300 a 400). En el tipo 2 son menos complejos, usan B12 en lugar de la cadena pequeña. Es una enzima multisubunitaria (dos subunidades idénticas B1 y dos subunidades idénticas B2) que es específica para la reducción de los nucleósidos difosfato (ADP, GDP, CDP y UDP) a su formas desoxi (dADP, dGDP, dCDP y dUDP) . El donador inmediato de los átomos de hidrógeno necesitada para la reducción de el grupo 2'hidroxi son dos grupos sulfidrilos en la propia enzima, quien, durante la reacción, forma un puente disulfuro.
Ribonucleotido reductasa de tipo 2 de E.coli (cursiva) . Presenta 4 subunidades beta: 2 grandes(B1) en gris y dos pequeñas (B2) en verde.
Propiedades fisico-químicas:
Número de aminoácidos: 359
Peso molecular: 40339.2
Teorico pI: 5.46
Composición de aminoácidos:
Ala (A) 43 12.0%
Arg (R) 28 7.8%
Asn (N) 14 3.9%
Asp (D) 26 7.2%
Cys (C) 4 1.1%
Gln (Q) 6 1.7%
Glu (E) 21 5.8%
Gly (G) 20 5.6%
His (H) 8 2.2%
Ile (I) 14 3.9%
Leu (L) 29 8.1%
Lys (K) 10 2.8%
Met (M) 9 2.5%
Phe (F) 13 3.6%
Pro (P) 14 3.9%
Ser (S) 27 7.5%
Thr (T) 23 6.4%
Trp (W) 9 2.5%
Tyr (Y) 18 5.0%
Val (V) 23 6.4%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%
(B) 0 0.0%
(Z) 0 0.0%
(X) 0 0.0%
Número total de residuos cargados negativamente (Asp + Glu): 47
Número total de residuos cargados positivamente (Arg + Lys): 38
Composición atómica:
Carbon C 1791
Hydrogen H 2742
Nitrogen N 498
Oxygen O 542
Sulfur S 13
Formula: C1791H2742N498O542S13
Número total de átomos: 5586
Coeficientes de extinción:
Unidades del caeficiente de extinción M-1 cm-1, at 280 nm medido en agua.
Ext. coefficient 76570
Abs 0.1% (=1 g/l) 1.898, assuming ALL Cys residues appear as half cystines
Ext. coefficient 76320
Abs 0.1% (=1 g/l) 1.892, assuming NO Cys residues appear as half cystines
Vida media estimada:
The N-terminal of the sequence considered is R (Arg).
La vida media estimada es de una hora (mammalian reticulocytes, in vitro).
2 min (yeast, in vivo).
2 min (Escherichia coli, in vivo).
Indice de estabilidad: 29.03
La proteina esta clasificada como estable.
Indice alifatico: 77.27
Grand average of hydropathicity (GRAVY): -0.318
Localizacion celular.
Mediante el programa PsortB, obtengo los siguientes datos:
Localization Scores:
Cytoplasmic 2.50
CytoplasmicMembrane 2.50
Cellwall 2.50
Extracellular 2.50
Como se puede observar la proteina se puede encontrar con la misma probabilidad en cualquiera de las localizaciones.
Péptido señal.
Buscamos el péptido señal con el Signal3, usando para ello neural network (NN) y hidden Marcov model (HMM).
**SignalP-NN result:**
[[image:http://www.cbs.dtu.dk/services/SignalP/tmp/TMP090706175337.7890523/plot.nn.1.gif]]
# [[http://www.cbs.dtu.dk/services/SignalP/tmp/TMP090706175337.7890523/nn-score.1|data]][[code]]
length = 70
# Measure Position Value Cutoff signal peptide?
max. C 29 0.208 0.52 NO
max. Y 38 0.166 0.32 NO
max. S 7 0.680 0.97 NO
mean S 1-37 0.255 0.51 NO
D 1-37 0.211 0.45 NO
>hari
Prediction: Non-secretory protein
Signal peptide probability: 0.000
Max cleavage site probability: 0.000 between pos. -1 and 0
Los datos muestran la ausencia de peptidos señal.
TatP-NN result:
data
length = 100
# Measure Position Value Cutoff Tat signal peptide?
max. C 38 0.454 0.51 NO
max. Y 67 0.193 0.35 NO
max. S 45 0.909 0.75 YES
mean S 1-66 0.769 0.30 YES
max. D 1-66 0.481 0.36 YES
# Most likely cleavage site between pos. 66 and 67: AGG-CG
# Potential Tat signal peptide but No Tat motif was found
# Used regex: RR.[FGAVML][LITMVF]
Los datos de las primeras pruebas muestran la ausencia de péptidos señal pero la prueba TatP nos informa del sitio mas propenso a la escision (entre la posicion 66 y la 67)
===Dominios transmenbrana.===
Esto se obtiene del analisis mediante TMHMM
Resultados:
My Length: 359
# My Number of predicted TMHs: 0
# My Exp number of AAs in TMHs: 1.92562
# My Exp number, first 60 AAs: 0
# My Total prob of N-in: 0.10259
My TMHMM2.0 outside 1 359
[[image:http://www.cbs.dtu.dk/services/TMHMM-2.0/tmp/TMHMM_7883387/My.gif width="612" height="308"]]
Vemos como la proteina esta libre, no atraviesa la menbrana, osea que no tiene dominios transmembrana pero aun asi existe una zona que tiene cierta liposolubilidad o se traba de alguna manera en ella.
===Motivos de la proteina.===
[[image:http://myhits.isb-sib.ch/wwwtmp/hourly/175991.png width="339" height="21" caption="match map segment"]]
[[image:http://myhits.isb-sib.ch/wwwtmp/hourly/175992.png width="359" height="1" caption="match map segment"]]
[[image:http://myhits.isb-sib.ch/wwwtmp/hourly/175993.png width="339" height="72" caption="match map segment"]]
[[image:http://myhits.isb-sib.ch/wwwtmp/hourly/175994.png width="359" height="1" caption="match map segment"]]
{{**Legends:** **1**, freq_pat:AMIDATION [?]; **2**, freq_pat:CAMP_PHOSPHO_SITE [?]; **3**, freq_pat:CK2_PHOSPHO_SITE [?]; **4**, freq_pat:MYRISTYL [?]; **5**, freq_pat:PKC_PHOSPHO_SITE [?]; **6**, freq_pat:RGD [?]; **7**, pat:RIBORED_SMALL [!]; **8**, prf:PPR [?].}}
[[image:file:///C:/Users/Daem/Pictures/1.jpg]][[image:file:///C:/Users/Daem/Pictures/1.jpg]][[image:1.jpg]]
[[image:2.jpg]]
[[image:3.jpg]]
[[image:4.jpg]]
===Hidrofobicidad===
Se calcula con el ProtScale, puedes realizarlo de diferentes maneras segun cojas una escala u otra, en este caso se ha usado la de Abraham y Leo.
Usando la escala de [[http://www.expasy.ch/tools/pscale/Hphob.Leo.html|**Hphob. / Abraham & Leo**]], los valores individuales de los aa son:
Con estos primers estoy mutando una Arginina por una Prolina.
Diseño de primers para realizar fusiones génicas entre la/s proteína/s de interés con la proteína fluorescente verde para estudiar su localización celular o su concentración a lo largo del crecimiento del microorganismo.
Primers para fusionar mi proteina con GFP:
El primer primer es el optimo de mi prot:
1ºPrimer: GAGAAGATTCCGCTGTCCAA
2º Primer: CTCCTTTACTCATAACGATTCGAGCATCACCGACG
3º Primer: CGTCGGTGATGCTCGAATCGTTATGAGTAAAGGAG 4ºPrimer 5’-TTATTTGTATAGTTC
5.- Escritura de un informe en castellano de la actividad realizada.
RESUMEN:
Rhodococcus (cursiva) es una bacteria inmovil, gram positiva y que no esporula Como hemos podido ver con las pruebas realizadas esta cercanamente emparentada con Corynebacterium y Mycobacterium. No suelen ser potógenos y viven en casi todo el mundo.
Se ha iniiciado el estudio del genoma de un representante de este género debido a que su importancia radica en la capacidad de otras especies para producir esteroides bioactivos, acrilamida y ácido acrílico. Además es importante en el proceso de degradación de productos contaminantes y la biodesulfuración de los combustibles fósiles.
Se ha analizado la secuencia génica, así como la protéica, determinando sus características y comparándolas con bases de datos de microorganismos cercanos.
Despues de realizar la busqueda de proteinas dentro de mi fragmento decidi analizar en profundidad la ribonucleotido difosfato reductasa subunidad beta que dentro del espectro de las ayadas me parecia de las más importantes ya que forma parte de una ribonucleotido reductasa, esta combierte ribonucleotidos en desoxirribonucleotidos que son esenciales en la sintesis de adn por lo que es vitale en el microorganimo.
Faltan referencias y el trabajo no está escrito como un trabajo científico.
Herramientas usadas:
Para la obtención de la secuencia de DNA se han cultivado las cepas y aislado la molécula usando las instalaciones del departamento de Microbiología de la Universidad de León.Se ha empleado medio TSB o YEME líquido para crecer las bacterias en matraces.
Tras aislar el DNA y crear con él una genoteca se han enviado los distintos fragmentos a la unidad de secuenciación de la Universidad de León.
El análisis posterior se ha realizado mediante herramientas bioinformáticas, programas de tratamiento de secuencias genéticas y proteicas, bases de datos, etc. Estos aparecen referenciados en el cuerpo del trabajo cuando se ha considerado conveniente citarlos.
Agradecimientos:
Agradezco a mis compañeros que me ayudaron en los momentos mas desafortunados, por todos los medios y facilidades a la Universidad de Leon y por supuesto a el profesor José A. Gil por darnos la asignatura y enseñarnos tantos conocimientos y herramientas y sobre todo por ayudarnos y facilitarnos aprobar la asignatura.
Referencias: (en qué parte del texto se han citado estas referencias????)
Nordlund P, Eklund H; , J Mol Biol 1993;232:123-164.: Structure and function of the Escherichia coli ribonucleotide reductase protein R2. PUBMED:8331655
1. Descubriendo el microorganismo de la secuencia.
.Situación taxonómica
Como se puede observar en este arbol filogenetico anuestra enigmática especie que aparece como Query es de la especie Rhodococcus con un 81% de posibilidades de ser Rhodococcus opacus
Taxonomía del microorganismo:
Reino: BacteriaPhylum: Actinobacteria
Clase: Actinobacteria
Subclase: Actinobacteridae
Orden: Actinomycetales
Suborden: Corynebacterineae
Familia: Nocardiaceae
Géneros: Rhodococcus
2. Análisis informático de la secuencia mediante el programa ARTEMIS
Con la secuencia de 17000 bases que se nos ha dado estudiamos todos los ORFs a través de la aplicación blast del NCBI.
El fragmento contiene 86 ORFs (CDS). Se indican a continuación los que codifican para proteínas y el lugar que ocupan en mi segmento de DNA:
Falta el esquema de Artemis
552:2330 reverse
815 bp at 5' side: MarR-family protein transcriptional regulator
290 bp at 3' side: elongation factor Ts
1984:2790 forward transcriptional regulator, TetR family protein
2806:4530 reverse extradiol dioxygenase
6014:6721 forward superoxide dismutase
Score = 86.1 bits (46), Expect = 4e-13
Identities = 392/551 (71%), Gaps = 55/551 (9%)
Strand=Plus/Plus
6538:7728 reverse ribonucleotide-diphosphate reductase subunit beta
Score = 551 bits (298), Expect = 6e-153
Identities = 776/995 (77%), Gaps = 80/995 (8%)
Strand=Plus/Minus
7562:9013 forward hypothetical membrane protein
8186:9163 reverse hypothetical membrane protein
10623:12377 forward hypothetical protein hypothetical membrane protein
10900:11721 reverse hypothetical protein
11399:11980 forward hypothetical protein
12352:13320 forward hypothetical protein
13148:14917 reverse superoxide dismutase
14792:15172 forward 88 bp at 5' side: superoxide dismutase
123 bp at 3' side: putative acyltransferase
15048:16979 reverse putative acyltransferase
peptide methionine sulfoxide reductase MsrA
16328:17000 forward peptide methionine sulfoxide reductase MsrA
Nombres de los genes en castellano, si escribe en castellano
Secuencia elegida:
6538:7728 reverse ribonucleotide-diphosphate reductase subunit betaScore = 551 bits (298), Expect = 6e-153
Identities = 776/995 (77%), Gaps = 80/995 (8%)
Strand=Plus/Minus
AGGCCGACTACATCGATCGGCTGTGGTCGCTCGTCGACTGGTCGGATGTGGGACGCAGGT
TCGAGGCGGCGCGCGCCGGACGCGCGTTCGACCTACGGGAGGCGATCGGCGGTGAGTGAC
CGCCTGGTCGATCGGGTTCACGCGATCAACTGGAACCGGGTGCCGGACCCCAAGGACGCC
GAGGTGTGGGACCGACTCACCGGCAATTTCTGGCTGCCCGAGAAGATTCCGCTGTCCAAC
GACCTCGCCTCGTGGGCGACGCTGACCGACACCGAGCGAGAGATGACCATCCGGGTGTTC
ACCGGGTTGACGTTGCTCGACACCGCGCAGGCCACCGTCGGAGCCGTCGCGATGATCGCC
GATGCCGTCACCCCACACGAGGAGGCCGTCCTGACGAACATGGCCTTCATGGAGTCGGTG
CACGCCAAGAGCTACAGTTCGATCTTCTCGACGCTGTGCTCCACTCGGCAAATCGATGCG
GCGTTCGAGTGGTCGGAGCGCAACCCGCACCTGCAGCGCAAGGCGCAGATCGTCGTCGAC
TACTACCGCGGCGACGACGCCCTCGCCCGCAAGGCGGCGTCGGTGATGCTCGAATCGTTC
CTGTTCTACAGCGGCTTCTACCTGCCGATGTACTGGGCAAGCCACGGCGAACTCACCAAC
ACCGCCGACCTGATCCGGTTGATCATCCGCGACGAGGCGGTACACGGGTACTACATCGGA
TACAAGTGCCGCAAAGCGCTCGAACGGCTCGACGCGAGCGCGCGCGACGCGCATCGGCGC
TACACCTACGACTTGTTGGAGACGCTCTATGCCAACGAGGTCGCGTACGCCGCCGATCTG
TACGACGAGGTGGGGTGGACGGCAGAGGTGGTGTCCTACATGCGGTTCAACGCGAACAAG
GCGCTCGCCAATCTCGGATACGAGCCCATGTTCCCAGTGTCCGAGTGCCAGGTGAACCCG
GCGATCCTGTCGGCCCTCGATCCCGGGGCCGGAGAGAACCACGACTTCTTCTCCGGCTCC
GGCAGCGCATACGTCATCGGGAAGCAGAAACCCACCGAGGACGTGGACTGGAACTTCTGA
En Doble cadena:
AGGCCGACTACATCGATCGGCTGTGGTCGCTCGTCGACTGGTCGGATGTGGGACGCAGGTTCGAGGCGGC 0
TCCGGCTGATGTAGCTAGCCGACACCAGCGAGCAGCTGACCAGCCTACACCCTGCGTCCAAGCTCCGCCG 0
GCGCGCCGGACGCGCGTTCGACCTACGGGAGGCGATCGGCGGTGAGTGACCGCCTGGTCGATCGGGTTCA 70
CGCGCGGCCTGCGCGCAAGCTGGATGCCCTCCGCTAGCCGCCACTCACTGGCGGACCAGCTAGCCCAAGT 70
CGCGATCAACTGGAACCGGGTGCCGGACCCCAAGGACGCCGAGGTGTGGGACCGACTCACCGGCAATTTC 140
GCGCTAGTTGACCTTGGCCCACGGCCTGGGGTTCCTGCGGCTCCACACCCTGGCTGAGTGGCCGTTAAAG 140
TGGCTGCCCGAGAAGATTCCGCTGTCCAACGACCTCGCCTCGTGGGCGACGCTGACCGACACCGAGCGAG 210
ACCGACGGGCTCTTCTAAGGCGACAGGTTGCTGGAGCGGAGCACCCGCTGCGACTGGCTGTGGCTCGCTC 210
AGATGACCATCCGGGTGTTCACCGGGTTGACGTTGCTCGACACCGCGCAGGCCACCGTCGGAGCCGTCGC 280
TCTACTGGTAGGCCCACAAGTGGCCCAACTGCAACGAGCTGTGGCGCGTCCGGTGGCAGCCTCGGCAGCG 280
GATGATCGCCGATGCCGTCACCCCACACGAGGAGGCCGTCCTGACGAACATGGCCTTCATGGAGTCGGTG 350
CTACTAGCGGCTACGGCAGTGGGGTGTGCTCCTCCGGCAGGACTGCTTGTACCGGAAGTACCTCAGCCAC 350
CACGCCAAGAGCTACAGTTCGATCTTCTCGACGCTGTGCTCCACTCGGCAAATCGATGCGGCGTTCGAGT 420
GTGCGGTTCTCGATGTCAAGCTAGAAGAGCTGCGACACGAGGTGAGCCGTTTAGCTACGCCGCAAGCTCA 420
GGTCGGAGCGCAACCCGCACCTGCAGCGCAAGGCGCAGATCGTCGTCGACTACTACCGCGGCGACGACGC 490
CCAGCCTCGCGTTGGGCGTGGACGTCGCGTTCCGCGTCTAGCAGCAGCTGATGATGGCGCCGCTGCTGCG 490
CCTCGCCCGCAAGGCGGCGTCGGTGATGCTCGAATCGTTCCTGTTCTACAGCGGCTTCTACCTGCCGATG 560
GGAGCGGGCGTTCCGCCGCAGCCACTACGAGCTTAGCAAGGACAAGATGTCGCCGAAGATGGACGGCTAC 560
TACTGGGCAAGCCACGGCGAACTCACCAACACCGCCGACCTGATCCGGTTGATCATCCGCGACGAGGCGG 630
ATGACCCGTTCGGTGCCGCTTGAGTGGTTGTGGCGGCTGGACTAGGCCAACTAGTAGGCGCTGCTCCGCC 630
TACACGGGTACTACATCGGATACAAGTGCCGCAAAGCGCTCGAACGGCTCGACGCGAGCGCGCGCGACGC 700
ATGTGCCCATGATGTAGCCTATGTTCACGGCGTTTCGCGAGCTTGCCGAGCTGCGCTCGCGCGCGCTGCG 700
GCATCGGCGCTACACCTACGACTTGTTGGAGACGCTCTATGCCAACGAGGTCGCGTACGCCGCCGATCTG 770
CGTAGCCGCGATGTGGATGCTGAACAACCTCTGCGAGATACGGTTGCTCCAGCGCATGCGGCGGCTAGAC 770
TACGACGAGGTGGGGTGGACGGCAGAGGTGGTGTCCTACATGCGGTTCAACGCGAACAAGGCGCTCGCCA 840
ATGCTGCTCCACCCCACCTGCCGTCTCCACCACAGGATGTACGCCAAGTTGCGCTTGTTCCGCGAGCGGT 840
ATCTCGGATACGAGCCCATGTTCCCAGTGTCCGAGTGCCAGGTGAACCCGGCGATCCTGTCGGCCCTCGA 910
TAGAGCCTATGCTCGGGTACAAGGGTCACAGGCTCACGGTCCACTTGGGCCGCTAGGACAGCCGGGAGCT 910
TCCCGGGGCCGGAGAGAACCACGACTTCTTCTCCGGCTCCGGCAGCGCATACGTCATCGGGAAGCAGAAA 980
AGGGCCCCGGCCTCTCTTGGTGCTGAAGAAGAGGCCGAGGCCGTCGCGTATGCAGTAGCCCTTCGTCTTT 980
CCCACCGAGGACGTGGACTGGAACTTCTGA 1080
GGGTGGCTCCTGCACCTGACCTTGAAGACT 1080
Secuencia de aminoácidos:
RPTTSIGCGRSSTGRMWDAGSRRRAPDARSTYGRRSAVSDRLVDRVHAINWNRVPDPKDA
EVWDRLTGNFWLPEKIPLSNDLASWATLTDTEREMTIRVFTGLTLLDTAQATVGAVAMIA
DAVTPHEEAVLTNMAFMESVHAKSYSSIFSTLCSTRQIDAAFEWSERNPHLQRKAQIVVD
YYRGDDALARKAASVMLESFLFYSGFYLPMYWASHGELTNTADLIRLIIRDEAVHGYYIG
YKCRKALERLDASARDAHRRYTYDLLETLYANEVAYAADLYDEVGWTAEVVSYMRFNANK
ALANLGYEPMFPVSECQVNPAILSALDPGAGENHDFFSGSGSAYVIGKQKPTEDVDWNF
3.- Análisis del gen que codifica para la proteína elegida
Diseño de primers para la amplificación del gen/es por PCR
Primer1: 5´ AGGCCGACTACATCGATCG 3´
Primer2: 5 ´ TCAGAAGTTCCAGTCCAC 3´
Estos dos primers izquierdo y derecho creados manualmente poco viables ya que al probarlos con el Primer3 nos dice que tienen diferentes tm y alta complementariedad 3´ en el primer izquierdo.
OLIGO start len tm gc% any 3' seq
LEFT PRIMER 1 19 61.18 57.89 6.00 6.00 AGGCCGACTACATCGATCG
RIGHT PRIMER 1080 18 51.30 50.00 5.00 2.00 TCAGAAGTTCCAGTCCAC
Tamaño de la secuencia: 1080 pb
Tamaño incluído entre los primers: 1080pb
Complementariedad entre primers: 6.00
Complementariedad del extremo 3': 0.00
¿Tm de los primers? ¿A qué temperatura realizaría la amplificación? ¿Sitios de corte de losprimers?
Diseño de primers para amplificar fragmentos internos del gen/es y comprobar si dicho gen/es son esenciales o no para el microorganismo.
Ahora con el Primer3 buscamos los primers más óptimos dentro de la secuencia:
OLIGO start len tm gc% any 3' seq
LEFT PRIMER 220 20 60.34 50.00 4.00 0.00 GAGAAGATTCCGCTGTCCAA
RIGHT PRIMER 617 20 60.02 50.00 5.00 0.00 AAGCCGCTGTAGAACAGGAA
SEQUENCE SIZE: 1080
INCLUDED REGION SIZE: 1080
PRODUCT SIZE: 398, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 3.00
Este es el más óptimo pero el programa te calcula otros adicionales:
ADDITIONAL OLIGOS
start len tm gc% any 3' seq
1 LEFT PRIMER 220 20 60.34 50.00 4.00 0.00 GAGAAGATTCCGCTGTCCAA
RIGHT PRIMER 602 20 60.23 50.00 5.00 0.00 AGGAACGATTCGAGCATCAC
PRODUCT SIZE: 383, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 1.00
2 LEFT PRIMER 220 20 60.34 50.00 4.00 0.00 GAGAAGATTCCGCTGTCCAA
RIGHT PRIMER 605 20 59.70 45.00 5.00 3.00 AACAGGAACGATTCGAGCAT
PRODUCT SIZE: 386, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 2.00
3 LEFT PRIMER 585 20 60.23 50.00 5.00 0.00 GATGCTCGAATCGTTCCTGT
RIGHT PRIMER 890 20 59.57 50.00 4.00 1.00 TTGAACCGCATGTAGGACAC
PRODUCT SIZE: 306, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 2.00
4 LEFT PRIMER 585 20 60.23 50.00 5.00 0.00 GATGCTCGAATCGTTCCTGT
RIGHT PRIMER 891 20 59.57 50.00 5.00 3.00 GTTGAACCGCATGTAGGACA
PRODUCT SIZE: 307, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 3.0
Para comprobar si el gen es esencial para el microorganismo la manera más sencilla y práctica es producir una delección en el gen mediante Pcr de forma que quede no funcional. Si en el posterior cultivo del microorganismo no muestra ninguna diferencia es que este gen no es esencial para su funcionamiento.
Cojo los primers generados por Primer3 que sean mas eficaces y dentro los cojo a mano los complementarios:
1ºprimer: GAGAAGATTCCGCTGTCCAA
2ºprimer: TCAAGCTAGAAGAGCTGCG
3ºprimer: GTTCGATCTTCTCGACGC
4ºprimer: AACAGGAACGATTCGAGCAT
........TGCCCGAGAAGATTCCGCTGTCCAACGACCTCGCCTCGTGGGCGACGCTGACCGACACCGAGCGAG 210
.........ACGGGCTCTTCTAAGGCGACAGGTTGCTGGAGCGGAGCACCCGCTGCGACTGGCTGTGGCTCGCTC 210
AGATGACCATCCGGGTGTTCACCGGGTTGACGTTGCTCGACACCGCGCAGGCCACCGTCGGAGCCGTCGC 280
TCTACTGGTAGGCCCACAAGTGGCCCAACTGCAACGAGCTGTGGCGCGTCCGGTGGCAGCCTCGGCAGCG 280
GATGATCGCCGATGCCGTCACCCCACACGAGGAGGCCGTCCTGACGAACATGGCCTTCATGGAGTCGGTG 350
CTACTAGCGGCTACGGCAGTGGGGTGTGCTCCTCCGGCAGGACTGCTTGTACCGGAAGTACCTCAGCCAC 350
CACGCCAAGAGCTACAGTTCGATCTTCTCGACGCTGTGCTCCACTCGGCAAATCGATGCGGCGTTCGAGT 420
GTGCGGTTCTCGATGTCAAGCTAGAAGAGCTGCGACACGAGGTGAGCCGTTTAGCTACGCCGCAAGCTCA 420
GGTCGGAGCGCAACCCGCACCTGCAGCGCAAGGCGCAGATCGTCGTCGACTACTACCGCGGCGACGACGC 490
CCAGCCTCGCGTTGGGCGTGGACGTCGCGTTCCGCGTCTAGCAGCAGCTGATGATGGCGCCGCTGCTGCG 490
CCTCGCCCGCAAGGCGGCGTCGGTGATGCTCGAATCGTTCCTGT
GGAGCGGGCGTTCCGCCGCAGCCACTACGAGCTTAGCAAGGA
4.- Análisis de la proteina elegida.
Diseño de primers para amplificar los genes que codifican para la/s proteína/s de interés con colas de histidina para su rápida purificación.
Primer izquierdo: CCCGAATTC GGGGAGAAGATTCCGCTGTCCAA
Primer derecho: CCCGAATTCGGGAGG CGCCGCCGCCGCCGCCGCAACGATTCGAGCAT
Hemos añadido un residuo de 6 histidinas (TAG) en extremo 3´ del primer derecho y hemos utilizado la secuencia de nucleotidos reconocida por EcoRI para la restricción.
Estudio de la/s proteína/s por bioinformática (dominios conservados, hidrofobicidad, estructura, características bioquímicas…..)
Los ribonucleótidos reductasa (RNR) catalizan la sintesis reductiva de desoxirribonucleotidos de sus correspondientes ribonucleotidos. Su unción es aportar los precursores para la sintesis de adn (ADN) . Los RNR se dividen segun el cofactor metálico usado. En este caso es de tipo 2 y usan coenzima B12 (adenosilcobalamina, AdoCbl). Faltan referencias.
RNR es una enzima oligomerica compuesta por una larga ( Large en ingles se es grande en castellano) subunidad (700 a 1000 residuos) y una subunidad pequeña (300 a 400). En el tipo 2 son menos complejos, usan B12 en lugar de la cadena pequeña. Es una enzima multisubunitaria (dos subunidades idénticas B1 y dos subunidades idénticas B2) que es específica para la reducción de los nucleósidos difosfato (ADP, GDP, CDP y UDP) a su formas desoxi (dADP, dGDP, dCDP y dUDP) . El donador inmediato de los átomos de hidrógeno necesitada para la reducción de el grupo 2'hidroxi son dos grupos sulfidrilos en la propia enzima, quien, durante la reacción, forma un puente disulfuro.
De la familia de las Ferritinas, la cual contiene 6 miembros:
FA_desaturase_2 Ferritin Mn_catalase Phenol_Hydrox Ribonuc_red_sm Rubrerythrin
Ontología
Ribonucleotido reductasa de tipo 2 de E.coli (cursiva) . Presenta 4 subunidades beta: 2 grandes(B1) en gris y dos pequeñas (B2) en verde.
Propiedades fisico-químicas:
Número de aminoácidos: 359
Peso molecular: 40339.2
Teorico pI: 5.46
Composición de aminoácidos:
Ala (A) 43 12.0%
Arg (R) 28 7.8%
Asn (N) 14 3.9%
Asp (D) 26 7.2%
Cys (C) 4 1.1%
Gln (Q) 6 1.7%
Glu (E) 21 5.8%
Gly (G) 20 5.6%
His (H) 8 2.2%
Ile (I) 14 3.9%
Leu (L) 29 8.1%
Lys (K) 10 2.8%
Met (M) 9 2.5%
Phe (F) 13 3.6%
Pro (P) 14 3.9%
Ser (S) 27 7.5%
Thr (T) 23 6.4%
Trp (W) 9 2.5%
Tyr (Y) 18 5.0%
Val (V) 23 6.4%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%
(B) 0 0.0%
(Z) 0 0.0%
(X) 0 0.0%
Número total de residuos cargados negativamente (Asp + Glu): 47
Número total de residuos cargados positivamente (Arg + Lys): 38
Composición atómica:
Carbon C 1791
Hydrogen H 2742
Nitrogen N 498
Oxygen O 542
Sulfur S 13
Formula: C1791H2742N498O542S13
Número total de átomos: 5586
Coeficientes de extinción:
Unidades del caeficiente de extinción M-1 cm-1, at 280 nm medido en agua.
Ext. coefficient 76570
Abs 0.1% (=1 g/l) 1.898, assuming ALL Cys residues appear as half cystines
Ext. coefficient 76320
Abs 0.1% (=1 g/l) 1.892, assuming NO Cys residues appear as half cystines
Vida media estimada:
The N-terminal of the sequence considered is R (Arg).
La vida media estimada es de una hora (mammalian reticulocytes, in vitro).
2 min (yeast, in vivo).
2 min (Escherichia coli, in vivo).
Indice de estabilidad: 29.03
La proteina esta clasificada como estable.
Indice alifatico: 77.27
Grand average of hydropathicity (GRAVY): -0.318
Localizacion celular.
Mediante el programa PsortB, obtengo los siguientes datos:
Localization Scores:
Cytoplasmic 2.50
CytoplasmicMembrane 2.50
Cellwall 2.50
Extracellular 2.50
Como se puede observar la proteina se puede encontrar con la misma probabilidad en cualquiera de las localizaciones.
Péptido señal.
Buscamos el péptido señal con el Signal3, usando para ello neural network (NN) y hidden Marcov model (HMM).
**SignalP-NN result:** [[image:http://www.cbs.dtu.dk/services/SignalP/tmp/TMP090706175337.7890523/plot.nn.1.gif]] # [[http://www.cbs.dtu.dk/services/SignalP/tmp/TMP090706175337.7890523/nn-score.1|data]][[code]] length = 70 # Measure Position Value Cutoff signal peptide? max. C 29 0.208 0.52 NO max. Y 38 0.166 0.32 NO max. S 7 0.680 0.97 NO mean S 1-37 0.255 0.51 NO D 1-37 0.211 0.45 NOSignalP-HMM result:>hari
Prediction: Non-secretory protein
Signal peptide probability: 0.000
Max cleavage site probability: 0.000 between pos. -1 and 0
data length = 100 # Measure Position Value Cutoff Tat signal peptide? max. C 38 0.454 0.51 NO max. Y 67 0.193 0.35 NO max. S 45 0.909 0.75 YES mean S 1-66 0.769 0.30 YES max. D 1-66 0.481 0.36 YES # Most likely cleavage site between pos. 66 and 67: AGG-CG # Potential Tat signal peptide but No Tat motif was found # Used regex: RR.[FGAVML][LITMVF] Los datos de las primeras pruebas muestran la ausencia de péptidos señal pero la prueba TatP nos informa del sitio mas propenso a la escision (entre la posicion 66 y la 67) ===Dominios transmenbrana.=== Esto se obtiene del analisis mediante TMHMM Resultados: My Length: 359 # My Number of predicted TMHs: 0 # My Exp number of AAs in TMHs: 1.92562 # My Exp number, first 60 AAs: 0 # My Total prob of N-in: 0.10259 My TMHMM2.0 outside 1 359 [[image:http://www.cbs.dtu.dk/services/TMHMM-2.0/tmp/TMHMM_7883387/My.gif width="612" height="308"]] Vemos como la proteina esta libre, no atraviesa la menbrana, osea que no tiene dominios transmembrana pero aun asi existe una zona que tiene cierta liposolubilidad o se traba de alguna manera en ella. ===Motivos de la proteina.=== [[image:http://myhits.isb-sib.ch/wwwtmp/hourly/175991.png width="339" height="21" caption="match map segment"]] [[image:http://myhits.isb-sib.ch/wwwtmp/hourly/175992.png width="359" height="1" caption="match map segment"]] [[image:http://myhits.isb-sib.ch/wwwtmp/hourly/175993.png width="339" height="72" caption="match map segment"]] [[image:http://myhits.isb-sib.ch/wwwtmp/hourly/175994.png width="359" height="1" caption="match map segment"]] {{**Legends:** **1**, freq_pat:AMIDATION [?]; **2**, freq_pat:CAMP_PHOSPHO_SITE [?]; **3**, freq_pat:CK2_PHOSPHO_SITE [?]; **4**, freq_pat:MYRISTYL [?]; **5**, freq_pat:PKC_PHOSPHO_SITE [?]; **6**, freq_pat:RGD [?]; **7**, pat:RIBORED_SMALL [!]; **8**, prf:PPR [?].}} [[image:file:///C:/Users/Daem/Pictures/1.jpg]][[image:file:///C:/Users/Daem/Pictures/1.jpg]][[image:1.jpg]] [[image:2.jpg]] [[image:3.jpg]] [[image:4.jpg]] ===Hidrofobicidad=== Se calcula con el ProtScale, puedes realizarlo de diferentes maneras segun cojas una escala u otra, en este caso se ha usado la de Abraham y Leo. Usando la escala de [[http://www.expasy.ch/tools/pscale/Hphob.Leo.html|**Hphob. / Abraham & Leo**]], los valores individuales de los aa son:Ala: 0.440 Arg: -2.420 Asn: -1.320 Asp: -0.310 Cys: 0.580 Gln: -0.710Glu: -0.340 Gly: 0.000 His: -0.010 Ile: 2.460 Leu: 2.460 Lys: -2.450
Met: 1.100 Phe: 2.540 Pro: 1.290 Ser: -0.840 Thr: -0.410 Trp: 2.560
Tyr: 1.630 Val: 1.730 : -0.815 : -0.525 : 0.399
1 2 3 4 5 6 7 8 9
1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00
edge center edge
MIN: -0.962
MAX: 1.662
code
Se observa en la gráfica el perfil de hidrofobicidad.
Enzimas que cortan a mi proteina:
Enzimas que no son capeces:
Caspase10
Caspase2
Caspase3
Caspase4
Caspase5
Caspase6
Caspase7
Caspase8
Caspase9
Enterokinase
Factor Xa
GranzymeB
Hydroxylamine
Thrombin
Tobacco etch virus protease
Mutagénesis in vitro del gen que codifica para la proteína elegida.
porqué ha elegido esa mutación???
........TGCCCGAGAAGATTCCGCTGTCCAACGACCTCGCCTCGTGGGCGACGCTGACCGACACCGAGCGAG 210
.........ACGGGCTCTTCTAAGGCGACAGGTTGCTGGAGCGGAGCACCCGCTGCGACTGGCTGTGGCTCGCTC 210
AGATGACCATCCGGGTGTTCACCGGGTTGACGTTGCTCGACACCGCGCAGGCCACCGTCGGAGCCGTCGC 280
TCTACTGGTAGGCCCACAAGTGGCCCAACTGCAACGAGCTGTGGCGCGTCCGGTGGCAGCCTCGGCAGCG 280
GATGATCGCCGATGCCGTCACCCCACACGAGGAGGCCGTCCTGACGAACATGGCCTTCATGGAGTCGGTG 350
CTACTAGCGGCTACGGCAGTGGGGTGTGCTCCTCCGGCAGGACTGCTTGTACCGGAAGTACCTCAGCCAC 350
CACGCCAAGAGCTACAGTTCGATCTTCTCGACGCTGTGCTCCACTCGGCAAATCGATGCGGCGTTCGAGT 420
GTGCGGTTCTCGATGTCAAGCTAGAAGAGCTGCGACACGAGGTGAGCCGTTTAGCTACGCCGCAAGCTCA 420
GGTCGGAGCGCAACCCGCACCTGCAGCGCAAGGCGCAGATCGTCGTCGACTACTACCGCGGCGACGACGC 490
CCAGCCTCGCGTTGGGCGTGGACGTCGCGTTCCGCGTCTAGCAGCAGCTGATGATGGCGCCGCTGCTGCG 490
CCTCGCCCGCAAGGCGGCGTCGGTGATGCTCGAATCGTTCCTGT
GGAGCGGGCGTTCCGCCGCAGCCACTACGAGCTTAGCAAGGA
1ºPrimer: GAGAAGATTCCGCTGTCCAA
2ºPrimer: CAAGAGCTACAGTTCCGTCTTCTCGAC
3ºPrimer GTTCTCGATGTCAAGGCAGAAGAGCTGCGAC
4ºprimer: AGGAACGATTCGAGCAT
Con estos primers estoy mutando una Arginina por una Prolina.
Diseño de primers para realizar fusiones génicas entre la/s proteína/s de interés con la proteína fluorescente verde para estudiar su localización celular o su concentración a lo largo del crecimiento del microorganismo.
Primers para fusionar mi proteina con GFP:
El primer primer es el optimo de mi prot:
1ºPrimer: GAGAAGATTCCGCTGTCCAA
2º Primer: CTCCTTTACTCATAACGATTCGAGCATCACCGACG
3º Primer: CGTCGGTGATGCTCGAATCGTTATGAGTAAAGGAG
4ºPrimer 5’-TTATTTGTATAGTTC
El último es el optimo derecho del GFP:
ATGAGTAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATG 0
TACTCATTTCCTCTTCTTGAAAAGTGACCTCAACAGGGTTAAGAACAACTTAATCTACCACTACAATTAC 0
……………………………………………………………….
CCCAACGAAAAGAGAGACCACATGGTCCTTCTTGAGTTTGTAACAGCTGCTGGGATTACACATGGCATGG 630
GGGTTGCTTTTCTCTCTGGTGTACCAGGAAGAACTCAAACATTGTCGACGACCCTAATGTGTACCGTACC 630
ATGAACTATACAAATAA 717
TACTTGATATGTTTATT 717
5.- Escritura de un informe en castellano de la actividad realizada.
RESUMEN:
Rhodococcus (cursiva) es una bacteria inmovil, gram positiva y que no esporula Como hemos podido ver con las pruebas realizadas esta cercanamente emparentada con Corynebacterium y Mycobacterium. No suelen ser potógenos y viven en casi todo el mundo.
Se ha iniiciado el estudio del genoma de un representante de este género debido a que su importancia radica en la capacidad de otras especies para producir esteroides bioactivos, acrilamida y ácido acrílico. Además es importante en el proceso de degradación de productos contaminantes y la biodesulfuración de los combustibles fósiles.
Se ha analizado la secuencia génica, así como la protéica, determinando sus características y comparándolas con bases de datos de microorganismos cercanos.
Despues de realizar la busqueda de proteinas dentro de mi fragmento decidi analizar en profundidad la ribonucleotido difosfato reductasa subunidad beta que dentro del espectro de las ayadas me parecia de las más importantes ya que forma parte de una ribonucleotido reductasa, esta combierte ribonucleotidos en desoxirribonucleotidos que son esenciales en la sintesis de adn por lo que es vitale en el microorganimo.
Faltan referencias y el trabajo no está escrito como un trabajo científico.
Herramientas usadas:
Para la obtención de la secuencia de DNA se han cultivado las cepas y aislado la molécula usando las instalaciones del departamento de Microbiología de la Universidad de León.Se ha empleado medio TSB o YEME líquido para crecer las bacterias en matraces.
Tras aislar el DNA y crear con él una genoteca se han enviado los distintos fragmentos a la unidad de secuenciación de la Universidad de León.
El análisis posterior se ha realizado mediante herramientas bioinformáticas, programas de tratamiento de secuencias genéticas y proteicas, bases de datos, etc. Estos aparecen referenciados en el cuerpo del trabajo cuando se ha considerado conveniente citarlos.
Agradecimientos:
Agradezco a mis compañeros que me ayudaron en los momentos mas desafortunados, por todos los medios y facilidades a la Universidad de Leon y por supuesto a el profesor José A. Gil por darnos la asignatura y enseñarnos tantos conocimientos y herramientas y sobre todo por ayudarnos y facilitarnos aprobar la asignatura.
Referencias: (en qué parte del texto se han citado estas referencias????)
Rnr4p, a novel ribonucleotide reductase small-subunit protein.
Wang PJ, Chabes A, Casagrande R, Tian XC, Thelander L, Huffaker TC.
Mol Cell Biol. 1997 Oct;17(10):6114-21.
PMID: 9315671 [PubMed - indexed for MEDLINE]
Related Articles Free article in PMC | at journal site
ribonucleotide-diphosphate reductase subunit beta [Bifidobacterium animalis subsp. lactis DSM 10140]
gi|241195787|ref|YP_002969342.1|[241195787]
Formation and function of the Manganese(IV)/Iron(III) cofactor in Chlamydia trachomatis ribonucleotide reductase.
Jiang W, Yun D, Saleh L, Bollinger JM Jr, Krebs C.
Biochemistry. 2008 Dec 30;47(52):13736-44. Review.
PMID: 19061340 [PubMed - indexed for MEDLINE]
Related Articles
ribonucleotide-diphosphate reductase subunit beta [Bacteroides sp. 9_1_42FAA]
gi|237710423|ref|ZP_04540904.1|[237710423]
Nordlund P, Eklund H; , J Mol Biol 1993;232:123-164.: Structure and function of the Escherichia coli ribonucleotide reductase protein R2. PUBMED:8331655
Modes of overinitiation, dnaA gene expression, and inhibition of cell division in a novel cold-sensitive hda mutant of Escherichia coli.
Fujimitsu K, Su'etsugu M, Yamaguchi Y, Mazda K, Fu N, Kawakami H, Katayama T.
J Bacteriol. 2008 Aug;190(15):5368-81. Epub 2008 May 23.
PMID: 18502852 [PubMed - indexed for MEDLINE]
Related Articles Free article in PMC | at journal site